Cumulative Distribution Function (CDF)

Big Data and Analytics - পরিসংখ্যান (Statistics) - Random Variables এবং Probability Distributions
420

Cumulative Distribution Function (CDF) একটি পরিসংখ্যানিক ফাংশন যা একটি র‌্যান্ডম ভ্যারিয়েবলের মানের চেয়ে ছোট বা সমান মানের সম্ভাবনা (probability) প্রদর্শন করে। এটি একটি ডেটাসেটের কিউমুলেটিভ (সমষ্টিগত) সম্ভাবনা বণ্টন নির্দেশ করে, অর্থাৎ এটি কতটুকু সম্ভাবনা রয়েছে যে একটি র্যান্ডম ভ্যারিয়েবলের মান একটি নির্দিষ্ট মানের নিচে বা তার সমান হবে।

CDF এর ধারণা:

যদি XX একটি র‌্যান্ডম ভ্যারিয়েবল হয়, তাহলে CDF হল:

F(x)=P(Xx)F(x) = P(X \leq x)

এখানে, F(x)F(x) হল CDF ফাংশন এবং P(Xx)P(X \leq x) হল XX-এর xx মানের চেয়ে ছোট বা সমান হওয়ার সম্ভাবনা।


CDF এর বৈশিষ্ট্য:

  1. আনুপাতিক বৃদ্ধি: CDF ফাংশন কখনোই হ্রাস পায় না, এটি শুধুমাত্র বাড়ে। অর্থাৎ, CDF একটি নিরবচ্ছিন্ন বা অবিচ্ছিন্নভাবে বৃদ্ধি পায়।
  2. মানের সীমা: CDF এর মান সর্বদা 0 থেকে 1 এর মধ্যে থাকে: 0F(x)10 \leq F(x) \leq 1
    • F(x)=0F(x) = 0 এর মানে হল যে XX এর মান কখনোই xx এর চেয়ে কম হবে না।
    • F(x)=1F(x) = 1 এর মানে হল যে XX এর মান সর্বদা xx এর চেয়ে কম বা সমান।
  3. নিরবচ্ছিন্নতা: CDF ফাংশন একেবারে কোন গ্যাপ বা লাফিং (jumping) ছাড়াই একটি নিরবচ্ছিন্ন ফাংশন হয়। বিশেষত, এটি সাধারণত সোজা বা ঝুঁকির সাথে পরিবর্তিত হয়।
  4. ডিফারেন্সিয়েবল ফাংশন: CDF-এর ডেরিভেটিভ হলো Probability Density Function (PDF) (যদি XX একটি অবিচ্ছিন্ন র‌্যান্ডম ভ্যারিয়েবল হয়)। এটি মূলত দেখায় যে একটি নির্দিষ্ট পরিসরের মধ্যে কতটুকু সম্ভাবনা রয়েছে।

CDF এর ব্যবহার:

  1. সম্ভাবনা গণনা: CDF ব্যবহার করে, আপনি সহজেই কোনো ডেটার মানের চেয়ে কম বা সমান হওয়ার সম্ভাবনা বের করতে পারেন।
    • উদাহরণ: যদি XX হল একজন শিক্ষার্থীর পরীক্ষার ফলাফল এবং xx হল ৭০, তাহলে P(X70)P(X \leq 70) হল F(70)F(70), অর্থাৎ পরীক্ষায় ৭০ বা তার কম নম্বর পাওয়ার সম্ভাবনা।
  2. ক্যালকুলেশন এবং তুলনা: CDF ব্যবহার করে, বিভিন্ন ডেটাসেটের সম্ভাবনার তুলনা করা যায় এবং তাদের গড়, পরিবর্তনশীলতা বা আউটলায়ার মূল্যায়ন করা যায়।
  3. বণ্টন বিশ্লেষণ: CDF ফাংশন ডেটার বণ্টন, যেমন Normal Distribution, Uniform Distribution, বা Exponential Distribution বিশ্লেষণ করতে ব্যবহৃত হয়।

CDF এর উদাহরণ:

ধরা যাক, XX একটি র‌্যান্ডম ভ্যারিয়েবল, যা 0 থেকে 10 পর্যন্ত একটি Uniform Distribution অনুসরণ করে (অর্থাৎ, XX এর মান 0 থেকে 10 এর মধ্যে যেকোনো মান হতে পারে এবং সমস্ত মানের সম্ভাবনা সমান)। এর জন্য CDF ফাংশন হবে:

F(x)={0যদি x<0x10যদি 0x101যদি x>10F(x) = \begin{cases} 0 & \text{যদি } x < 0 \\ \frac{x}{10} & \text{যদি } 0 \leq x \leq 10 \\ 1 & \text{যদি } x > 10 \end{cases}

এখানে, যদি x=5x = 5, তাহলে:

F(5)=510=0.5F(5) = \frac{5}{10} = 0.5

অর্থাৎ, XX এর মান 5 বা তার কম হওয়ার সম্ভাবনা হল 0.5 বা 50%।


CDF এবং PDF এর মধ্যে সম্পর্ক:

  • PDF (Probability Density Function): CDF এর ডেরিভেটিভ হলো PDF। যদি F(x)F(x) হল CDF, তবে PDF হবে:

f(x)=ddxF(x)f(x) = \frac{d}{dx} F(x)

  • CDF এবং PDF এর সম্পর্ক: CDF ডেটার সম্ভাবনার সমষ্টি (cumulative probability) দেয়, যেখানে PDF ডেটার নির্দিষ্ট একটি পরিসরে সম্ভাবনার ঘনত্ব বা বন্টন প্রদর্শন করে।

CDF এর আউটপুট

  • CDF একটি সোজা গ্রাফের মতো হতে পারে যা নির্দিষ্ট সীমা xx-এর নিচে XX এর মানের সম্ভাবনা দেখায়। এটি 0 থেকে 1 এর মধ্যে বাড়ে।
  • যখন xx বৃদ্ধি পায়, CDF এর মানও বাড়ে, যা একটি একধরনের শিখর সৃষ্টি করে।

সারাংশ

Cumulative Distribution Function (CDF) হল একটি পরিসংখ্যানিক ফাংশন যা র‌্যান্ডম ভ্যারিয়েবলের মানের চেয়ে ছোট বা সমান হওয়ার সম্ভাবনা চিহ্নিত করে। এটি ডেটার কিউমুলেটিভ সম্ভাবনা প্রদর্শন করে এবং র‌্যান্ডম ভ্যারিয়েবলটির বণ্টন বুঝতে সহায়ক। CDF এবং PDF একে অপরের সাথে সম্পর্কিত, যেখানে CDF হল PDF এর সমষ্টি। CDF ফাংশন বিভিন্ন ডেটাসেটের বৈশিষ্ট্য বিশ্লেষণ করতে এবং সম্ভাবনা গণনা করতে ব্যবহার করা হয়।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...